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基于 有 线 电 视 互 动 点 播 业 务 的 大 数据 分 析 推 荐 系统 探析 


摘 要: 在 当今 智能 化 云 计算 的 时 代 大 变革 背景 下 ， 有 线 电视 也 进入 了 大 数据 分 析 的 新 阶段 。 互 动 点 播 作 为 有 线 电视 的 核心 
业务 之 一 ， 将 观众 从 播放 控制 中 解放 出 来 ， 自 由 选择 喜欢 的 节目 。 对 这 一 功能 的 技术 支持 就 是 互动 电视 传输 技术 ， 基 于 这 项 
技术 可 以 进行 大 数据 的 分 析 等 操作 。 本 文 围绕 有 线 电视 互动 点 播 业 务 大 数据 分 析 系 统 展开 论 述 ， 通 过 推荐 数据 模型 的 论述 ， 
谈 一 谈 大 数据 分 析 推 荐 系统 在 有 线 电视 互动 点 播 业 务 中 的 应 用 
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互动 点 播 业 务 是 广电 运营 三 网 融合 之 后 在 商业 模式 上 的 ”的 个 性 、 喜 好 等 没有 被 进行 仔细 深入 的 研究 "。 这 是 导致 业 
一 个 创新 之 举 。 在 前 有 移动 通讯 后 有 互联 网 电视 的 竞争 态势 ” 务 量 低 的 主要 原因 。 也 就 是 说 ,粗放 型 的 服务 方式 显然 跟 不 
让， 广电 运营 的 目标 是 借助 互动 电视 ， 冲 出 三 网 融合 之 困 ， 上 新 时 代 的 需要 了 。 
与 IPTV、OTT 立 于 三 足 易 立 之 势 。 因此 ， 向 互联 网 视频 学 习 ， 运 用 大 数据 分 析 系 统 ， 将 用 
1. 运用 大 数据 对 有 线 电 视 互 动 点 播 业务 进行 分 析 的 时 代 背 景 。” 户 喜 好 、 年 龄 、 消 费 能 力 等 进行 挖掘 和 分 析 ， 适 时 推出 适合 
开展 互动 点 播 业务 ， 就 要 开通 点 播 业务 功能 ， 这 个 功能 ”个 人 的 视频 解决 方案 , 是 有 线 电视 运营 商 今后 要 关注 的 方向 。 


属于 付费 项 目 ， 如 何 能 让 用 户 接受 这 种 付费 点 播 模式 呢 ? 从 ”2. 大 数据 分 析 概 述 

当前 市 场 推广 的 占有 率 来 看 ， 能 够 接受 付费 服务 的 用 户 数额 有 线 电视 的 互动 点 播 业务 的 终端 载体 为 数字 机 顶 盒 ， 通 
较 少 。 首 先是 常年 来 我 国 用 户 已 经 习惯 了 收看 原 有 模式 的 有 ”过 这 一 终端 ， 大 数据 分 析 系 统 可 以 实现 的 功能 包括 : 

线 电视 节目 ， 而 且 ， 对 于 有 线 电视 的 收视 习惯 也 己 经 固化 ， 用 户 机 项 盒 的 了 如、 用 户 的 个 人 情况 , 如 姓名 、 家 庭 住址 、 


忽然 让 用 户 自 掏腰包 购买 双向 机 顶 盒 ， 而 不 使 用 免费 发 放 的 ”授权 的 信息 、 账 户 及 密码 等 ， 都 可 以 通过 终端 加 以 采集 ; 媒 
机 顶 盒 ， 似 乎 一 时 无 法 接受 。 但 是 ， 这 个 费用 与 互联 网 视频 。 体 的 人 、 类 型 、 名 称 、 国 家 、 导 演 、 演 员 、 付 费 金 额 、 市 
的 收费 相 比 ， 是 小 巫 见 大 焉 的 。 因 此 收费 问题 并 不 是 影响 有 目 简 介 、 高清 还 是 超 清 等 , 都 可 以 通过 机 项 盒 终 端子 以 采集 ; 
线 电视 互动 点 播 业 务 市 场 占有 率 低 的 主要 原因 。 所 有 的 D, 包括 交易 、 用 户 、 资 源 ， 还 有 点 播 的 时 间 、 点 播 
广电 总 局 关于 三 网 融合 的 改革 进行 以 来 ， 对 于 有 线 电视 。 的 量 、 节 目的 单价 等 信息 , 均 可 以 通过 数字 机 项 盒 加 以 采集 ; 
网 络 的 互动 点 播 业 务 已 经 成 为 了 广电 运营 的 主推 业务 之 一 。 通过 了 D 可 以 对 节目 的 评价 、 评 分 等 加 以 采集 ; 对 机 顶 盒 遥 
现 有 的 广电 商业 模式 不 断 进行 着 创新 ， 互 动 电视 的 点 播 业务 。” 控 絮 的 操作 进行 数据 采集 ， 如 播放 、 和 暂停 等 。 
正在 与 IPTV .OTT 等 在 市 场 竞争 的 残酷 态势 下 争取 一 席 之 地 。 通过 数字 机 项 盒 等 终端 采集 到 的 数据 ， 与 用 户 喜好 、 个 
我 国 现 有 的 有 线 电 视 互动 点 播 业务 ， 真 正 能 够 实现 付费 ”性 特征 、 社 会 阶层 等 细 化 的 数据 采集 要 求 相 距 其 远 。 因 此 还 
点 播 功 能 还 不 成 熟 , 能 够 接受 这 项 业务 的 用 户 数量 也 比较 少 。 ”是 难以 脱离 粗放 式 的 数据 分 析 模 式 。 要 达到 对 用 户 喜 好 、 视 
这 给 互动 点 播 业务 的 拓展 、 增 值 业 务 带 来 巨大 的 难度 。 因 此 频 内 容 详 细 描述 、 视 频 切 换 频 度 、 节 目 观看 时 长 等 更 加 精细 
有 线 电视 运营 商 提 供 的 互动 点 播 业 务 只 是 在 原 有 的 播 出 模式 ”的 数据 分 析 要 求 ， 并 从 中 分 析 用 户 与 数据 之 间 的 联系 ， 为 有 
上 对 节目 源 进 行 了 一 定 的 聚合 ， 距 离 真正 的 节目 细 化 、 移 动 线 电视 互动 点 播 业务 营销 提供 有 利 的 数据 依据 ， 必 须要 实行 
电视 新 业务 、 节 目 EPG 等 还 相差 深远 。 目 前 仍然 没有 摆脱 。 数据 价值 最 大 化 ， 也 就 是 大 数据 分 析 ， 采 用 精准 推荐 模型 为 
由 运营 商 推送 节目 ， 而 不 是 根据 用 户 喜好 ， 对 用 户 群 体 进行 。 数据 建 模 ""。 
细 分 后 的 服务 节目 的 推送 模式 。 导 致 当前 的 有 线 电视 业务 的 2. 1 互动 点 播 业务 大 数据 推荐 算法 
使 用 率 盘 旋 在 低位 ， 依 然 停留 在 粗放 式 的 经 营 模式 中 。 这 是 为 了 利用 用 户 网 络 的 分 析 计 算 行为 ， 目 的 就 是 要 推 
那么 从 互动 点 播 的 节目 内 容 进行 分 析 。 有 线 电视 运营 商 。 测 用 户 感 兴趣 的 地 方 到 底 在 哪里 。 使 用 到 的 计算 方法 包括 协 
推送 的 互动 点 播 节目 源 基 本 是 在 原 有 节目 的 基础 上 ， 再 整合 。 同 过 滤 推 荐 算法 、 基 于 内 容 的 推荐 算法 、 基 于 网 络 结构 的 推 
了 一 部 分 节目 ， 对 节目 的 EPG 进行 了 归 类 和 细 化 ， 又 增加 ”着 算法 等 。 第 一 种 目前 被 使 用 得 较为 频繁 ， 也 就 是 协同 过 滤 
了 点 播 、 时 移 电视 等 新 业务 。 推 送 模 式 依然 是 传统 的 ， 用户。 推荐 算法 : 将 用 户 的 兴趣 模型 打造 为 用 户 项 目 关联 矩阵 ， 公 
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式 为 : mxn，m 为 用 户 数量 ,na 是 项 目的 数量 。 
和 矩阵 的 取 值 与 系统 的 类 型 设 定 对 应 。 包 括 了 用 户 对 项 目 

的 评分 值 ， 用 户 购 买 或 者 浏览 项 目 时 对 和 矩 阵 填充 的 数据 以 及 

根据 用 户 偏 好 行为 形成 的 目标 用 户 的 项 目 推 荐 列表 。 

根据 协同 过 滤 推荐 算法 ,我 们 将 有 线 电视 的 互动 点 播 业 
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撑 系 统 ， 尽 量 减少 新 系统 的 建设 成 本 ， 一 个 折衷 方案 : 利 
用 遥控 器 操作 数据 和 预先 制作 的 视频 内 容 描述 数据 ， 按 采样 
时 间 进 行 量化 分 析 ， 形 成 用 户 喜 好 描述 文档 ， 再 使 用 基于 内 
容 的 推荐 算法 对 用 户 喜 好 描述 文档 进行 挖掘 分 析 ， 由 此 得 出 
推荐 数据 模型 。 


务 的 数据 可 以 加 以 整理 。 以 100 个 有 线 电视 互动 点 播 业 务 用 
户 为 计算 基数 。 对 不 同 用 户 针对 同一 节目 资源 的 评分 数据 加 
以 采集 “。 

对 同一 资源 的 收看 和 评分 ， 用户 可 以 根据 用 户 集 G 进 
行 定义 ， 当 有 新 用 户 试图 点 播 节 目 时 ， 采 用 用 户 集 的 方法 对 
新 用 户 的 喜好 进行 预测 。 


| Py E> sim(c¢,©) Teo.s 


Sim(c,G) 是 采用 夹 角 余弦 或 者 Pearson 相关 的 计算 。 
2. 2 互动 点 播 业 务 大 数据 优化 算法 

有 线 电 视 互 动 点 播 业 务 的 数据 分 析 目 前 来 说 还 有 很 多 缺 
点 ， 如 对 视频 收看 的 频段 、 演 员 的 对 白 兴 趣 关 注 度 等 ， 还 无 
法 掌握 到 极致 ， 因 此 ， 推 荐 的 效果 远 远 达 不 到 令 人 满意 的 程 
度 。 

这 是 由 于 采样 设备 的 局 限 性 造成 的 结果 。 机 顶 盒 遥 控 器 
对 上 述 问题 的 解决 ， 只 能 记录 下 特定 时 间 段 遥控 器 的 操作 ， 
如 播放 、 和 暂停 等 。 对 于 文档 的 记录 ,用 户 遥 控 器 的 数据 操作 ， 
都 还 需要 进一步 从 技术 层面 加 大 力度 ， 实 现 数据 回 传 和 分 析 
功能 ， 通 过 推荐 的 算法 ， 得 到 更 为 精准 的 用 户 推荐 方案 ”。 

我 们 所 要 谈 的 就 是 这 种 精准 的 用 户 推荐 方案 一 一 基于 内 
容 的 推荐 算法 。 这 种 算法 实现 了 决 冷 启 动 , 数据 稀疏 的 问题 ， 
可 以 有 效 补 充 协同 过 滤 推 荐 算法 。 当 然 ， 这 种 算法 也 有 局 限 
性 ， 就 是 会 收 到 内 容 提取 技术 的 约束 。 而 且 算法 复杂 ， 耗 费 
计算 能 力 和 时 间 。 
怎么 样 既 不 损耗 过 多 的 精力 ， 又 能 达到 数据 的 精准 结 
呢 。 本 文 提 出 的 方案 如 下 : 

利用 迁 控 器 的 操作 数据 和 描述 数据 的 功能 ， 将 用 户 的 嘉 
好 描述 成 文档 ， 采 用 基于 内 容 的 推荐 算法 进行 分 析 ， 得 到 数 
据 模 型 。 

从 用 户 喜 好 描述 文档 ， 我 们 能 够 看 到 的 数据 包括 用 户 喜 
好 度 、 关 键 词 的 出 现 频率 、 用 户 的 兴趣 点 。 

再 通过 协同 过 滤 推 荐 算法 ， 结 合 基于 内 容 的 推荐 算法 ， 
对 用 户 的 兴趣 点 进行 更 加 精准 的 计算 ， 形 成 更 优化 的 推荐 数 
据 模型 : 将 用 户 喜 好 度 和 用 户 评分 显示 为 文档 中 不 同 词汇 的 
权重 , 然后 利用 词 频 差异 的 特征 算法 计算 用 户 喜 好 描述 文档 ， 
使 用 向 量 空间 来 进行 显示 ， 最 终 完 成 推荐 数据 模型 。 

基于 内 容 的 推荐 算法 可 以 有 效 解 决 冷 启 动 问题 、 数 据 稀 
琉 性 问题 ， 是 基于 协同 过 滤 推 荐 算法 的 有 效 补充 ， 但 是 因为 
该 算法 受到 内 容 提取 技术 的 约束 ， 实 现 较为 不 易 ; 另外 ， 
因为 内 容 提取 技术 算法 较为 复杂 ， 需 要 消耗 较 多 的 计算 能 
和 计算 时 间 。 为 了 有 效 利用 既 有 的 有 线 电视 互动 点 播 业 务 支 
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3. 有 线 电视 互动 点 播 业务 大 数据 分 析 优 化 方案 设想 

有 线 电视 互动 点 播 大 数据 来 自 两 个 方面 ， 一 个 方面 是 通 
过 机 项 盒 采集 ， 信 息 内 容 包 括 账户 和 业务 数据 等 。 一 个 方面 
是 对 用 户 操 作 遥 控 器 采集 数据 。 这 类 数据 是 事件 类 范畴 ， 实 
时 性 不 高 ， 但 是 数量 庞大 。 先 采用 协同 过 滤 推 荐 算法 完成 第 
一 次 加 工 ， 然 后 采用 近似 在 线 的 数据 处 理 分 析 推 荐 算法 完成 
数据 的 第 二 次 加 工 品 。 
这 个 解决 方案 首先 是 将 账户 、 业 务 、 评 价 等 数据 离线 存 
储 在 平台 上 ， 在 一 定 的 生产 环境 下 部 署 有 利于 性 能 调整 优化 
的 新 算法 。 利 用 基于 协同 过 滤 推 荐 算法 计算 框架 中 的 数据 并 
进行 加 工 ， 结 合计 算 模 块 中 的 用 户 信 息 进行 实时 的 数据 传输 
与 分 析 ， 例 如 初步 实时 计算 基于 内 容 的 模块 ， 控 制 计 算 量 ， 
缩短 系统 的 响应 时 间 ， 增 加 推荐 精度 。 
4. 结语 

针对 有 线 电视 互动 点 播 业 务 数据 的 大 数据 分 析 ， 采 用 基 
于 协同 过 滤 推 荐 和 基于 内 容 的 推荐 算法 是 目前 较为 流行 的 推 
荐 算法 。 通 过 两 种 算法 的 混合 推荐 模型 的 分 析 ， 得 到 了 基于 
荐 模型 的 数据 算法 ， 为 有 线 电视 互动 点 播 的 应 用 提供 了 大 
数据 技术 的 支持 。 辆 
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